AI资讯新闻榜单内容搜索-LLM

a16z 提出 AI 产品的「水晶鞋效应」：第一批用户反而是最忠诚的

前几天，AI 推理服务供应商 OpenRouter 发布了一份报告《State of AI》，基于平台上 60 多家提供商的 300 多个模型，100 万亿个 token 的交互数据，对 LLM 的实际应用情况进行了分析。报告中，提到了一个「灰姑娘水晶鞋效应」，特别有意思。研究者在分析用户留用数据时发现一个现象：AI 模型发布第一个月进来的用户，往往比后来进来的用户留存率更高。

来自主题: AI技术研报

7457 点击 2025-12-12 16:15

Khosla 继 OpenAI 后的最大赌注，General Intuition 凭 38 亿个游戏高光片段做世界模型

今年 10 月，专注构建世界模型的 General Intuition 完成了高达 1.34 亿美元的种子轮融资。这笔融资由硅谷传奇投资人 Vinod Khosla 领投，这是他自 2019 年首次投资 OpenAI 以来开出的最大单笔种子轮投资，也标志着他在 LLM 之后对下一代智能范式做出的一次重大下注。

来自主题: AI资讯

9058 点击 2025-12-11 10:59

扩散语言模型推理太慢？北大团队提出ODB-dLLM框架，破解计算访存双重瓶颈

基于扩散的大语言模型 (dLLM) 凭借全局解码和双向注意力机制解锁了原生的并行解码和受控生成的潜力，最近吸引了广泛的关注。例如 Fast-dLLM 的现有推理框架通过分块半自回归解码进一步实现了 dLLM 对 KV cache 的支持，挑战了传统自回归 LLMs 的统治地位。

来自主题: AI技术研报

5929 点击 2025-12-11 10:42

开源在压榨GPU性价比！Linux 基金会掌门人揭露AI时代新技术栈：PARK！LLM 已经开始泡沫化，AI其实还没真正改变世界

在本周一举行的 Open Source Summit Japan 主题演讲中，Linux 基金会执行董事 Jim Zemlin 抛出了一个耐人寻味的判断： “AI 可能还谈不上全面泡沫化，但大模型或许已经开始泡沫化了。”

来自主题: AI资讯

10340 点击 2025-12-09 15:08

LLM强化学习不稳定之谜，被Qwen团队从「一阶近似」视角解开

如今，强化学习（RL）已成为提升大语言模型（LLM）复杂推理与解题能力的关键技术范式，而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性，LLM 的 RL 通常依赖序列级奖励 —— 即根据完整生成序列给一个标量分数。

来自主题: AI技术研报

5631 点击 2025-12-08 10:27

基于文本AI的终结？Agent协作可直接「复制思维」，Token效率暴涨

一直以来，传统 MAS 依赖自然语言沟通，各个 LLM 之间用文本交流思路。这种方法虽然可解释，但冗长、低效、信息易丢失。LatentMAS 则让智能体直接交换内部的隐藏层表示与 KV-cache 工作记忆，做到了：

来自主题: AI技术研报

7306 点击 2025-12-06 11:08

从 LLM 到 World Model：为什么我们需要能理解并操作世界的空间智能？

如今 LLM 的语言理解与生成能力已展现出惊人的广泛适用性，但随着 LLM 的发展，一个事实越发凸显：仅靠语言，仍不足以支撑真正的智能。

来自主题: AI技术研报

9854 点击 2025-12-04 09:57

深度讨论 Gemini 3 ：Google 王者回归，LLM 新一轮排位赛猜想｜Best Ideas

最近两周的模型竞赛非常热闹：OpenAI 在 11 月 12 日发布 GPT-5.1，引入更强的推理深度与更高效的对话体验；Google 在 11 月 18 日发布 Gemini 3，全面强化多模态理解与复杂推理能力；Anthropic 在 11 月 24 日又发布了 Claude Opus 4.5，模型在专业文档处理、代码生成与长流程 agent 方面有显著提升。

来自主题: AI资讯

8142 点击 2025-11-28 09:27

Adam的稳+Muon的快？华为诺亚开源ROOT破解大模型训练「既要又要」的两难困境

在 LLM 优化领域，有两个响亮的名字：Adam（及其变体 AdamW）和 Muon。

来自主题: AI技术研报

9919 点击 2025-11-27 14:37

Karpathy组建大模型「议会」，GPT-5.1、Gemini 3 Pro等化身最强智囊团

前 OpenAI 联合创始人、特斯拉 AI 总监 Andrej Karpathy 也一样。他在前几天发推，说自己「开始养成用 LLM 阅读一切的习惯」。Karpathy 在周六用氛围编程做了个新的项目，让四个最新的大模型组成一个 LLM 议会，给他做智囊团。

来自主题: AI资讯

9741 点击 2025-11-23 19:39